学术前沿丨当计量经济学遭遇机器学习(三):高维回归之岭回归
The following article is from 计量经济学及Stata应用 Author 陈强
高维回归的源起
经济学有高维数据吗?
情形一:数据本身可能就是高维的。比如,人口普查、工业调查或家庭调查数据,通常包括每位个体的数百个变量。而交易层面的数据(包括网购与零售扫描数据)、社交媒体的数据、以及文本挖掘的数据,其变量则一般成千上万,甚至更多。
情形二:尽管原始变量(raw variables)不多,但我们通常不知道这些变量应以怎样的函数形式(functional form)进入回归方程。为了解决潜在非线性,研究者可能加入原始变量的平方项、交互项(interaction terms)、甚至更高次项,以及其他变换(比如取对数),使得最终变量的个数大大增加。
高维回归的挑战
严格多重共线性是家常便饭
岭回归
岭回归的几何解释
岭回归的局限性
►往期推荐
回复【Python】👉 简单有用易上手
回复【学术前沿】👉机器学习丨大数据
回复【数据资源】👉公开数据
回复【可视化】👉 你心心念念的数据呈现
回复【老姚专栏】👉老姚趣谈值得一看
►一周热文
工具&方法 | 6张卡片,2分钟,轻松掌握R命令大集合(推荐收藏备用)
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
欢迎扫描👇二维码添加关注